1 건강보험 청구자료?

1.1 국내 보건의료 빅데이터


* 보건의료 분야에서의 빅데이터 활용 동향

  • 데이터 분석 기술의 발전에 따라 보건의료 분야에서도 빅데이터의 활용 부각
  • 해외에서는 공공 정책 및 민간 분야 전반에서 관련 사업 대두
  • 국내 역시 보건의료 빅데이터 관련 정책이 수립되면서 중요성 증가
  • 보건복지부 등 8개 부처는 연간 4조원 이상의 R&D 투자 – 바이오 헬스 산업 혁신 전략 수립


* 국내 보건의료 빅데이터 현황 - 이차자료원


* 국내 보건의료 빅데이터

  • 센서스(census, 총조사) 자료
    • 국가가 주관이 되어 통일된 기준에 따라, 조사 대상의 총수와 그 개별적 특성을 일일이 조사하는 전국적 규모의 통계조사
    • 예) 인구주택총조사
  • 등록(registry)/신고 자료
    • 특정 분야에 대한 지속적인 모니터링을 위하여 별도의 등록, 신고절차를 만들어 이를 통하여 지속적이고 체계적으로 수집/관리하는 자료
    • 기 수집된 의무기록을 활용하여 특정 목적에 따라 별도로 수집/관리하는 자료
    • 예) 중앙암등록자료, 감염병신고자료, 퇴원손상심층조사, 국가 응급의료진료망 등
  • 설문조사(survey) 자료
    • 체계적인 샘플링 방식으로 표본을 선정하고, 표본 집단을 대상으로 설문조사를 진행하여 얻는 자료
    • 비교적 대표성이 확보된 상태임
    • 단면조사일 경우, 인과성을 밝히기는 어려움
    • 지역을 포함한 개인별 사회경제적 수준에 대한 정보가 많으나 상병에 대한 정보는 적음
    • 비교적 원자료 접근이 용이함
    • 예) 국민건강영양조사, 지역사회건강조사, 의료패널 등
  • 건강보험 청구자료(insurance claims data)
    • 건강보험법에 의해 요양급여심사 및 요양급여 적정성 평가를 위하여 의료기관으로부터 청구된 자료
    • 전국민 자료, 개인별 추적관찰 가능
    • 상병코드 타당도 문제가 지적되기는 하나, 검진의 경우 다양한 항목(혈압, 혈당 등) 측정값이 포함
    • 지역을 포함한 개인별 사회경제적 수준에 대한 정보가 포함
    • 자료접근이 점차 용이해지는 상황
    • 예) 건강보험심사평가원, 국민건강보험공단 청구자료


1.2 건강보험 청구자료


* 건강보험 청구자료 자료원

  • 건강보험심사평가원 자료
    • 표본 자료(연도별)
    • 2009년부터 연도별로 표본 추출한 건강보험자료
    • 연구용 전수자료
      • 연구자가 원하는 조건의 자료(250G 이내)
  • 건강보험공단 자료
    • 표본코호트 자료(2002-2015)
      • 2006년 100만명 표본 추출한 환자의 14년간 기록
    • 맞춤형 전수자료
      • 연구자가 원하는 조건의 자료


* 건강보험 청구자료: 건강보험심사평가원

  • 환자표본자료(HIRA-NPS 등)
    • 환자단위로 표본추출한 진료내역 자료
    • 일반 연구자 등이 쉽게 연구에 활용할 수 있도록 제공
    • 관련 학회에 제공 및 타당성 검증 -> 공식적 대외 제공
    • 원격분석으로 변경
  • 연구용 전수자료
    • 원시청구명세서 진료내역 제공
    • 보건의료분야 연구전문기관 및 단체에 제공
    • 개인식별가능 정보는 제공하지 않음
    • 원격분석 가능


* 건강보험 청구자료: 건강보험공단

  • 표본코호트 자료
    • 환자단위로 표본추출한 진료내역 자료
    • 일반 연구자 등이 쉽게 연구에 활용할 수 있도록 제공
    • 대표성에 관한 타당성 검증 -> 공식적 대외 제공
    • 원격분석
  • 맞춤형 전수자료
    • 원시청구명세서 진료내역 제공
    • 보건의료분야 연구전문기관 및 단체에 제공
    • 개인식별가능 정보는 제공하지 않음
    • 공단 센터에 방문하여 분석(원주, 서울, 각 지역 등)


* 건강보험 청구자료: 심평원 vs. 공단

  • 본질적으로 차이가 없음
    • 의료기관/약국에서는 심평원에 명세서를 제출
    • 심평원에서 ‘심사’ 종료된 후, 명세서를 공단으로 송부
    • 공단은 명세서에 통계청 사망자료, 건강검진자료를 연계
    • 사망여부, 사망원인 (사망 일자는 알 수 없음)
    • 건강검진자료(BMI, 알코올, 흡연력 등 포함)


* 건강보험 청구자료: 심평원 표본 자료


* 건강보험 청구자료: 공단 표본코호트 자료


1.3 청구자료 구성 테이블

* 공단 표본코호트 자료

* 심평원 표본자료는 2009년부터 제공되며며, 건강검진테이블, 사망원인코드 존재하지 않음


* 테이블 구성


* 자격 및 보험료 테이블

  • 각 해당년도 연초 자격 기준
  • 건강보험가입자 및 의료급여 수급권자로 구성
  • 10개 변수
    • 기준년도, 개인고유번호, 성별, 가입자구분 등


* 출생 및 사망 테이블

  • 통계청 사망원인 연계
  • 5개 변수
    • 개인고유번호, 출생연도, 사망연월, 사망원인1,2


* 진료 테이블



* 명세서


* 명세서: 명세서일반(20 Table)


* 명세서: 진료내역(30 Table)


* 명세서: 상병내역(40 Table)


* 명세서: 처방전교부상세내역(60(53) Table)


* 건강검진 테이블

  • 건강검진 주요 결과 미 문진에 의한 생활 습관 및 행태관련 자료

* 건강검진 테이블: 문진자료(흡연)

#### * 건강검진 테이블: 문진자료(음주) {-}


* 요양기관 테이블

  • 요양기관의 시설, 장비, 인력관련 자료 등 이력 확인 가응

1.4 공단, 심평원 site


* 건강보험심사평가원

https://opendata.hira.or.kr/


* 건강보험공단

https://nhiss.nhis.or.kr/

1.5 건강보험 청구자료 분석시 고려사항


* 장점

  • 요양기관을 방문한 환자의 비급여를 제외한 모든 의료서비스 이용 정보가 포함되어 분석결과의 일반화 가능
  • 의료서비스 내역(시술/수술, 검사, 약제처방, 치료재료 등), 서비스별 급여 비용 등이 포함되어 환자가 받은 개별적인 의료서비스 확인 가능
  • 환자 고유 식별자가 자료에 포함되어 환자의 추적 자료 구축 가능


* 고려사항

  • 상병 정확도

    • 의료보험자료 상병기호의 정확도 추정 및 관련 특성 분석(법정전염병을 중심으로)
      • 신의철 외 (1998): 10.1%
    • 건강보험 질병코드의 타당도 제고방안 및 자료의 활용방안 수립
      • 박병주 (2003): 악성종양 77.6%, 관상동맥질환 54.2%, 천식 41.2 %, 뇌졸중 31.4%, 간질 55.4%
    • 건강보험 청구질병코드와 의무기록 일치도 평가 및 제고방안
      • 박은철 (2017)
        • 주상병 3자리 일치율: 82.0%
        • 부상병 3자리 일치율: 56.4%
  • 상병코드 뿐만 아니라 처치코드, 약물코드 등을 활용하여 질환 정의의 민감도를 높일 필요가 있음

  • 동일 명세서 내에서의 검사, 처치, 약물처방 등의 시간적 순서를 파악할 수 없음

    • 특정한 결과 발생을 예방하기 위한 시술과 특정한 결과 발생 후 치료를 목적으로 수행되는 시술이 동일한 경우, 동일한 명세서 내에서는 해당 시술이 예방적 치료인지, 발생 후 치료에 해당하는지를 구분할 수 없음
  • 동일 입원의 명세서의 분리 청구

    • 입원 기간 중 월이 달라질 경우 월별로 구분하여 청구
    • 30일을 초과하여 입원진료를 하는 경우 월단위로 분리하여 청구
    • 동일 입원에 대한 분석이 필요한 경우 명세서의 입원 에피소드 등의 조작적 정의 필요
  • 오분류 비뚤림(misclassification bias)

    • 포괄수가제: 세부진료내역 확인이 어려움
    • 급여제한
    • 산정특례
    • Drug exposure misclassification: 약국의 구입 명세서보다 의료기관의 처방 내역을 활용
  • 청구자료는 급여체계 내에서 수집되는 자료이므로, 분석대상 청구자료의 연도에 따라 의료기술을 포함하여 약물코드, 처치 코드 등의 급여기준, 급여횟수 제한 및 변경사항에 대한 확인이 필요

  • 분석에 이용되는 자료기간 내에 수가코드, 약품코드, 치료재료 코드의 변경이 있는지 검토 필요

  • 청구자료 분석 시 유의사항

    • 상병코드의 불일치 및 병기파악 불가로 인해 환자 선정에 대한 명확한 조작적 정의 필요
    • 임상적 자료의 부재
    • 기입 오류로 인한 자료의 한계 파악
      • 심결비용 부재, 상병코드 부재, 투약 정보 부재 등
    • 명확한 end point 정의 불가능


* 활용

  • 명세서 기반의 분석
    • 질병이나 의료이용, 의약품 사용 현황을 파악하기 위해 수행
      • 관심있는 질병으로 인한 연도별 의료이용 현황
      • 연도별 특정 의약품의 사용현황 등을 단면적으로 파악
  • 환자 기반의 분석
    • 명세서를 이용한 환자 기준의 데이터를 구축 후, 질병의 발생률, 유병률 등을 산출
    • 실제 인구집단에서 이루어지는 일상 진료환경에서 노출 또는 치료의 성과를 평가하는 성과연구 수행
      • 성과의 인과성을 설명하기 위해 코호트 연구 또는 환자-대조군 연구 등의 연구설계 필요
      • 관찰연구에서 발생하는 교란요인들을 보정하기 위한 적절한 통계분석 방법 적용 필요